热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

需求方|供需_面对开发平台数据工具链和需求等信息不对称,AI开发者如何进行破局?...

篇首语:本文由编程笔记#小编为大家整理,主要介绍了面对开发平台数据工具链和需求等信息不对称,AI开发者如何进行破局?相关的知识,希望对你有一定的参考价值。

篇首语:本文由编程笔记#小编为大家整理,主要介绍了面对开发平台数据工具链和需求等信息不对称,AI 开发者如何进行破局?...相关的知识,希望对你有一定的参考价值。



AI 在社会发展进程中扮演着日益重要的角色。全球最具权威的 IT 研究与顾问咨询公司 Gartner(高德纳)对 AI 的未来发展给出了自己的预测,Gartner 首席分析师 Afraz Jaffri 表示:“人工智能创新有望带来巨大的、甚至变革性的收益……应该特别关注预计将在 2-5 年内成为主流的创新类别,包括复合人工智能(composite AI)、决策智能(decision intelligence)和边缘人工智能(edge AI)。尽早采用这些创新技术可以带来显著的竞争优势和商业价值,并缓解人工智能模型的脆弱性问题。”开发者社区 CSDN 的 3000 万注册开发者中,689 万开发者阅读、撰写与研究 AI 技术,其中精准聚焦 AI 学习及应用的开发者人数达到了 154 万。如这些行业人士所熟知,AI 领域仍有诸多困扰着开发者的痛点亟待解决。



从技术到商业,阻碍 AI 发展的痛点突破遭遇瓶颈?


随着技术水平的不断发展,AI 展现出了自身丰富的可塑性。而塑造这一创新艺术的设计师——AI 开发者,在面对开发平台、数据、工具链、生态支持和收益循环信息不对称的情况下,无法更好的施展自身的技术能力


根据 Gartner 人工智能创新技术成熟度曲线反映了以下四个概念互补的人工智能类别:


以数据为中心的人工智能(Data-centric AI);以模型为中心的人工智能(Model-centric AI);以应用为中心的人工智能(Applications-centric AI);以人为本的人工智能(Human-centric AI)。


“数据、模型、应用、人”是人工智能技术的核心要素,也都面临亟待解决的困境。以数据为例,越是高质量的、具有核心竞争力的数据,就越容易涉及敏感信息的隐私安全问题,也越是需要保护的资产,造成数据共享使用的诸多障。而 AI 的发展离不开高质量数据,对于初创公司而言,获取客户信任,得到客户业务数据是一项非常艰难的任务。另外,标记数据通常十分珍贵,甚至大部分时候是缺失的,这也导致了他们在研发数据驱动型产品的道路上增添了阻碍。另一种现象是数据激增,产生大量的半结构化数据和非结构化数据。数据标注工作量太过复杂,海量的数据标注需要投入大量时间和精力,但现实是 AI 开发者不得不花时间去进行数据加工处理。



在模型方面,随着模型的不断演化,对模型的攻击、盗用等事件频频发生,AI 开发者面临着算法模型在对外调用及优化过程中的泄露风险;其次是技术和开发工具门槛高,对于个人、高校等 AI 开发者或者是部分初创公司在前期投入资金不足、信息闭塞的情况下无法对接到最正确的技术方向和甄别性价比高的开发工具。对 AI 来说,算力是重要资源,而算力资源成本高,硬件采购成本高,算力成本居高不下难以承担;最后是资源利用效率低,需求与供给的匹配需待优化,开发协助沟通不畅,开发涉及多角色协同,沟通不畅会极大地影响效率。


在 AI 的供需对接方面,需求方的发现和对接对于大部分 AI 开发者而言是有困难的。专注于技术层面的开发者在与 AI 需求者交流过程中无法捕捉到用户切实的需求,或者在需求筛选的过程中需要消耗大量的精力,这对于 AI 开发者而言是低性价比的消耗。


如何帮助 AI 行业,实现更高性价比的精力分配,让 AI 数据相关的挑战得以缓解,让 AI 公司更高效地对接市场,让 AI 公司接触真实需求而非技术谈兵。



破开困境的亚历山大之剑


为了更好地解决 AI 发展的一些困境,翼方健数近日正式宣布上线隐私安全计算护航的 AI 服务平台——揽睿星舟。平台运用隐私安全计算技术,在保护数据和算法安全的前提下,汇聚行业及公共数据集,集约算力部署,集成包括软硬件在内的最新 AI 技术,提供全流程一站式服务。揽睿星舟用数据、算力、资金、技术和运营能力加速 AI 发展,赋能长尾的 AI 应用场景,充分实现人工智能供需之间的高质量对接。揽睿星舟这个项目源自于翼方健数在隐私安全计算在市场上与 AI 行业的痛点碰撞,结合了来自 AI 与数据协作过程中的安全保护案例、AI 供应商技术遴选案例、AI 招投标及比赛案例,能够满足基于需求与技术融合推动的一系列 AI 场景需求。



在发布会上,翼方健数首席科学家张霖涛博士针对 AI 生态的不同角色和痛点视角,介绍了揽睿星舟 AI 服务平台提供的针对性解决方案。尤其针对 AI 开发者,平台提供端到端 AI 全生命周期开发工具。平台 AI 应用商城内汇聚丰富的 AI 工具链与预训练模型,形成从数据处理到算法开发和部署的服务闭环。包括数据标注、juypter lab、vscode、模型管理、模型推理、主流机器学习框架、镜像管理等,包括开箱即用的 AI-Ops 全流程工具供开发者使用。为了让 AI 开发者与技术服务商能够在平台内使用到称手的工具,应用商城除了集成自研的工具更引入了来自生态合作伙伴的优质工具。


作为云计算厂商的战略合作伙伴,平台为 AI 开发者提供高性价比的多种云服务器,AI 开发者可以通过登录平台,创建工作空间实例,环境内可直接调度所希望配置的云算力资源并直接调用。同时,也支持直接连接指定的 GIT 仓库,通过对象存储接口导入平台内,导入后直接挂载高效文件系统,使用算力。


对于 AI 开发者至关重要的数据集资源,揽睿星舟平台内配置了丰富的数据市场,集成海内外公开数据集、翼方健数 IoDC 网络内节点数据、企业自有一方数据。数据种类涉及营销、金融、医疗、生信、政务等各个行业。用户在平台申请并获得数据授权后,可一键将数据集纳入训练任务或工作空间中。



作为加载了隐私安全计算技术的 AI 服务平台,在隐私安全保护方面,平台帮助 AI 协作生态中不同角色实现数据、模型、计算结果的多向保护,例如数据提供商能够将全量数据集分割为若干样本数据(可见区)与实际数据集(保护区/不可见区),并分别存放至可见区与不可见区。在黑盒环境内,开发者提供的模型与数据提供商提供的真实数据双方均不可见,但可通过授权互相使用。导出环境环节,AI 开发者若需要参数调试(fine-tuning)在获得数据提供商授权后才可通过系统日志进行“数据可用不可见”模型调参,同样,在打包输出项目资源时,只有在数据所有者授权的情况下才能下载模型,从而保障了数据及模型的安全和隐私性,打破双方合作的信任壁垒。



AI 企业发展的土壤:实现商业供需撮合的“技术平台”


AI 开发者或者 AI 初创公司在商务对接上大多面临三种难题,首先是难以找到匹配的商业机会,其次是有 AI 需求的企业客户通常不信任初创企业,不愿意直接提供数据进行训练,最后,早期的AI初创团队通常营销资源匮乏,没有大规模营销团队拓展销售商机。


揽睿星舟平台的负责人张霖涛此前担任前微软亚洲研究院首席研究员,全球合伙人,系国际电气和电子工程师学会院士(IEEE Fellow)及 ACM 计算机领域的杰出会员(ACM Distinguished Member),在 AI,大数据,计算机系统和硬件加速方面超过 20 年研究和工程经验。作为微软亚洲研究院这一“中国人工智能黄埔军校”的毕业生,他深刻理解怀揣技术梦想在 AI 领域创业的不易。有大量的 AI 初创公司创始人往往是人工智能专家,当前模式下,他们亟需懂业务、懂市场,也懂 AI 的人才。而这样的人才,凤毛麟角。


对此张霖涛表示,揽睿星舟不仅是 AI 企业发展的技术土壤,平台上还有各行业的 AI 需求方正在寻找合适的供应商和解决方案。他们有应用场景,也有相关的数据。揽睿星舟促成需求方方及 AI 开发者、数据方和模型方互补合作,形成双赢局面。这为众多 AI 企业带来了新的解决方案。


揽睿星舟 AI 服务平台内支持提供生态合作伙伴企业自定义宣传主页进行 AI 生态内精准推广。同时,通过自有销售网络,揽睿星舟运营团队为合作伙伴提供全国甚至国际商机推荐服务,以中立的隐私安全计算能力帮助打破各方的不信任关系,平台帮助清晰梳理 AI 需求,从源头把控质量,全周期保障数据隐私与商业机密,匹配领域最佳企业和团队,协同输出专业方案,在统一的 AI 开发环境下及时知晓开发进展与作业质量,量化评测模型的效果,让 AI 需求方验收无后顾之忧。


以一家知名珠宝首饰企业为例。其作为传统制造业企业需要结合计算机视觉等技术进行产线智能质检,但是对于 AI 技术能力上投入尚少,需要寻找一个适配性高、服务成本低的 AI 供给方。该企业的需求是产品生产过程中的瑕疵检测,可以提供生产线上的检验设备和数据采集设备,需要 AI 供给方完成算法的构建和部署。该需求在揽睿星舟平台上发布后,通过揽睿星舟专业的运营团队,进行 AI 供给方的模型及能力遴选,最终匹配到最为合适的 AI 模型供给方,完美的解决了产线瑕疵检测的 AI 难题。


据悉,目前已有多家机构于揽睿星舟人工智能开放平台初步实现包括市场需求、场景对接、技术协作、数据共享等方面真正意义上的人工智能生态开放。


翼方健数作为隐私计算四小龙、作为隐私计算开源的第一梯队成员,发布揽睿星舟 AI 服务平台与生态目标也为 AI 平台提出了一个新思路,能否在 AI 领域里持续为开发者和新产业赋能,通过隐私安全计算破局开发平台、数据、工具链和需求等信息不对称以及信任缺失等诸多问题,值得期待。


推荐阅读
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • Java序列化对象传给PHP的方法及原理解析
    本文介绍了Java序列化对象传给PHP的方法及原理,包括Java对象传递的方式、序列化的方式、PHP中的序列化用法介绍、Java是否能反序列化PHP的数据、Java序列化的原理以及解决Java序列化中的问题。同时还解释了序列化的概念和作用,以及代码执行序列化所需要的权限。最后指出,序列化会将对象实例的所有字段都进行序列化,使得数据能够被表示为实例的序列化数据,但只有能够解释该格式的代码才能够确定数据的内容。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • VScode格式化文档换行或不换行的设置方法
    本文介绍了在VScode中设置格式化文档换行或不换行的方法,包括使用插件和修改settings.json文件的内容。详细步骤为:找到settings.json文件,将其中的代码替换为指定的代码。 ... [详细]
  • 开发笔记:加密&json&StringIO模块&BytesIO模块
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识,希望对你有一定的参考价值。一、加密加密 ... [详细]
  • Android中高级面试必知必会,积累总结
    本文介绍了Android中高级面试的必知必会内容,并总结了相关经验。文章指出,如今的Android市场对开发人员的要求更高,需要更专业的人才。同时,文章还给出了针对Android岗位的职责和要求,并提供了简历突出的建议。 ... [详细]
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • JVM 学习总结(三)——对象存活判定算法的两种实现
    本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法:引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活,虽然简单高效,但无法解决循环引用的问题;可达性分析算法通过判断对象是否可达来确定存活对象,是主流的Java虚拟机内存管理算法。 ... [详细]
  • 本文介绍了高校天文共享平台的开发过程中的思考和规划。该平台旨在为高校学生提供天象预报、科普知识、观测活动、图片分享等功能。文章分析了项目的技术栈选择、网站前端布局、业务流程、数据库结构等方面,并总结了项目存在的问题,如前后端未分离、代码混乱等。作者表示希望通过记录和规划,能够理清思路,进一步完善该平台。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
author-avatar
用户q4oaa53j5h
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有